National Repository of Grey Literature 31 records found  1 - 10nextend  jump to record: Search took 0.01 seconds. 
Bioinformatic Tool for Classification of Bacteria into Taxonomic Categories Based on the Sequence of 16S rRNA Gene
Valešová, Nikola ; Hon, Jiří (referee) ; Smatana, Stanislav (advisor)
Tato práce se zabývá problematikou automatizované klasifikace a rozpoznávání bakterií po získání jejich DNA procesem sekvenování. V rámci této práce je navržena a popsána nová metoda klasifikace založená na základě segmentu 16S rRNA. Představený princip je vytvořen podle stromové struktury taxonomických kategorií a používá známé algoritmy strojového učení pro klasifikaci bakterií do jedné ze tříd na nižší taxonomické úrovni. Součástí práce je dále implementace popsaného algoritmu a vyhodnocení jeho přesnosti predikce. Přesnost klasifikace různých typů klasifikátorů a jejich nastavení je prozkoumána a je určeno nastavení, které dosahuje nejlepších výsledků. Přesnost implementovaného algoritmu je také porovnána s několika existujícími metodami. Během validace dosáhla implementovaná aplikace KTC více než 45% přesnosti při predikci rodu na datových sadách BLAST 16S i BLAST V4. Na závěr je zmíněno i několik možností vylepšení a rozšíření stávající implementace algoritmu.
Detection of Enzymes in Metagenomic Data
Smatana, Stanislav ; Martínek, Tomáš (referee) ; Hon, Jiří (advisor)
This thesis presents specification and implementation of a system for detection of enzymes in metagenomic data. The detection is based on a provided enzyme sequence and its goal is to search the metagenomic sample for its novel variants. In order to guarantee that found enzymes truly have the desired catalytic function, the system employs a number of catalytic function verification methods. Their specification, implementation and evaluation is one of the main contributions of this thesis. Experiments have shown, that proposed methods reach sensitivity as high as 89%, specificity of 95%, values of AUC metric above 0.9 and average throughput of 1,203 verifications per second on regular personal computer. Evaluation of the system also led to discovery of a partial sequence of novel haloalkane dehalogenase enzyme in a metagenomic sample from soil. The implementation is able to work on a personal computer as well as on a grid computing environment.
Methods of processing Oxford Nanopore sequencing data for metagenomics
Barilíková, Lujza ; Provazník, Ivo (referee) ; Kupková, Kristýna (advisor)
The revolutionary sequencing technology introduced by Oxford Nanopore Technologies – MinION holds a great promise in the field of metagenomics. Low cost, produced long reads and portability, due to its small dimensions, represents only one of the many advantages of this technology. Despite the benefits, there is a lack of available computational tools for handling the produced data. The theoretical part of the thesis first introduces current sequencing technologies with main focus on the third-generation sequencing and especially on nanopore sequencing. The recent possibilities of metagenomic data visualization are introduced. The main purpose of the bachelor thesis is to make an algorithm for binning of metagenomic samples based on use of dimensionality reduction techniques straight on raw data produced by nanopore sequencing.
Tool for Classification of Lifestyle Traits Based on Metagenomic Data from the Large Intestine
Kubica, Jan ; Hon, Jiří (referee) ; Smatana, Stanislav (advisor)
This thesis deals with analysis of human microbiome using metagenomic data from large intestine. The main focus is placed on bacteria composition in a sample on different taxonomic levels regarding the lifestyle traits of an individual. For this purpose, a tool for classification of several attributes was created. It considers attributes like diet type and eating habits (vegetarian, vegan, omnivore), gluten and lactose intolerance, body mass index, age or sex. From range of machine learning perspectives considering K Nearest Neighbours (kNN), Random Forest (RF) and Support Vector Machines (SVM) were used. Datasets for training and final evaluation of the classifier were taken from American Gut project. The thesis also focuses on particular problems with metagenomic datasets like its multidimensionality, sparsity, compositional character and class imbalance.
Bacteria Classification Based on Marker Genes
Pelantová, Lucie ; Hon, Jiří (referee) ; Smatana, Stanislav (advisor)
The aim of this work is proposal of new method for bacteria classification based on sequences of marker genes. For this purpose was chosen 10 marker genes. Resulting MultiGene classifier processes data set by dividing it in several groups and choosing gene for each group which can distinguish this group with best results. This work describes implementation of MultiGene classifier and its results in comparison with other bacteria classifiers and with classification based entirely on gene 16S rRNA.
Bacteria Classification into Taxonomic Categories Based on Properties of 16s rRNA
Grešová, Katarína ; Hon, Jiří (referee) ; Smatana, Stanislav (advisor)
The main goal of this thesis was to design and implement a tool that would be able to classify the sequences of the 16S rRNA gene into taxonomic categories using the properties of the 16S rRNA gene. The created tool analyzes all input sequences simultaneously, which differs from common classification approaches, which classify input sequences individually. This tool relies on the fact that bacteria contain several copies of the 16S rRNA gene, which may differ in sequence. The main contribution of this work is design, implementation and evaluation of the capabilities of this tool. Experiments have shown that the proposed tool is able to identify the corresponding bacteria for smaller datasets and determine the correct ratios of their abundances. However, with larger datasets, the state space becomes very large and fragmented, which requires further improvements in order for it to search the state space in an efficient way.
Detection of chimeras in amplicon sequencing
Heřmánková, Kristýna ; Jurečková, Kateřina (referee) ; Sedlář, Karel (advisor)
Chimeric sequences are the most common artifacts that can occur in sequencing data after the sample amplification using the polymerase chain reaction. The presence of these artifacts can negatively affect results of the analysis. Therefore, the detection and subsequent filtration of chimeric sequences is an important step in the computational processing of sequencing data. This work deals with the principle of chimera formation and the possibility of reducing their occurrence. The aim of this work is to implement an algorithm for chimeras detection in R language and testing its accuracy on data provided by the Veterinary Research Institute in Brno.
Methods for Comparative Analysis of Metagenomic Data
Sedlář, Karel ; Vinař,, Tomáš (referee) ; Lexa, Matej (referee) ; Provazník, Ivo (advisor)
Moderní výzkum v environmentální mikrobiologii využívá k popisu mikrobiálních komunit genomická data, především sekvenaci DNA. Oblast, která zkoumá veškerý genetický materiál přítomný v environmentálním vzorku, se nazývá metagenomika. Tato doktorská práce se zabývá metagenomikou z pohledu bioinformatiky, která je nenahraditelná při výpočetním zpracování dat. V teoretické části práce jsou popsány dva základní přístupy metagenomiky, včetně jejich základních principů a slabin. První přístup, založený na cíleném sekvenování, je dobře rozpracovanou oblastí s velkou řadou bioinformatických technik. Přesto mohou být metody pro porovnávání vzorků z několika prostředí podstatně vylepšeny. Přístup představený v této práci používá unikátní transformaci dat do podoby bipartitního grafu, kde je jedna partita tvořena taxony a druhá vzorky, případně různými prostředími. Takový graf plně reflektuje kvalitativní i kvantitativní složení analyzované mikrobiální sítě. Umožňuje masivní redukci dat pro jednoduché vizualizace bez negativních vlivů na automatickou detekci komunit, která dokáže odhalit shluky podobných vzorků a jejich typických mikrobů. Druhý přístup využívá sekvenace celého metagenomu. Tato strategie je novější a příslušející bioinformatické nástroje jsou méně propracované. Hlavní výzvou přitom zůstává rychlá klasifikace sekvencí, v metagenomice označovaná jako „binning“. Metoda představená v této práci využívá přístupu zpracování genomických signálů. Tato unikátní metodologie byla navržena na základě podrobné analýzy redundance genetické informace uložené v genomických signálech. Využívá transformace znakových sekvencí do několika variant fázových signálů. Navíc umožňuje přímé zpracování dat ze sekvenace nanopórem v podobě nativních proudových signálů.
Bioinformatic Tool for Estimation of Abundances of Bacterial Functional Molecules in Biological Samples Based on 16S rRNA Metagenomic Data
Bieliková, Michaela ; Hon, Jiří (referee) ; Smatana, Stanislav (advisor)
Ľudské telo je prostredím pre život neuveriteľného množstva mikróbov. Niektoré z nich môžu spôsobovať rôzne choroby, ale ďalšie, napríklad črevný mikrobióm, sú pre život a zdravie človeka nepostrádateľné. Nanešťastie, črevný mikrobióm nie je detailne preštudovaný, pretože obsahuje tisíce rôznych druhov baktérií, z ktorých väčšina sa nedá kultivovať v laboratórnych podmienkach. Riešením tohto problému sú nové rýchle metódy sekvenovania v kombináciou s bioinformatickými nástrojmi na výpočet funkčného profilu baktérií vo vzorke. V tejto práci si predstavíme existujúce nástroje predpovedajúce funkčný profil, a následne navrhneme nový nástroj, ktorý môže implementovať konsenzus nad výsledkami existujúcich nástrojov, alebo sa môže jednať o úplne nový nástroj.
Numerical methods for classification of metagenomic data
Vaněčková, Tereza ; Sedlář, Karel (referee) ; Škutková, Helena (advisor)
This thesis deals with metagenomics and numerical methods for classification of metagenomic data. Review of alignment-free methods based on nucleotide word frequency is provided as they appear to be effective for processing of metagenomic sequence reads produced by next-generation sequencing technologies. To evaluate these methods, selected features based on k-mer analysis were tested on simulated dataset of metagenomic sequence reads. Then the data in original data space were enrolled for hierarchical clustering and PCA processed data were clustered by K-means algorithm. Analysis was performed for different lengths of nucleotide words and evaluated in terms of classification accuracy.

National Repository of Grey Literature : 31 records found   1 - 10nextend  jump to record:
Interested in being notified about new results for this query?
Subscribe to the RSS feed.